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ADN POLYMERASE THERMOSTABLE ET INTEINES DE L'ESPECE 
THERMOCOCCUS FUMICOLANS 

La presente invention concerne une nouvelle ADN 
5 polymerase thermostable ainsi que ses deux inteines, 
provenant d'une archaebacterie de l'espece Thermococcus 
fumicolans . 

Les ADN polymerases sont des enzymes impliquees 
dans la replication et la reparation de 1'ADN dans toute 

10 cellule vivante. On connait aujourd'hui de nombreuses ADN 
polymerases isolees de micro-organismes tel que E. coli 
(ADN polymerase I) ou du phage T4 . Des ADN polymerases 
ont aussi ete identifiees et purifiees et a partir de 
micro-organismes thermophiles comme Thermus aquaticus 

15 (Taq polymerase, Chien, A. et al . J. Bact. 1976, 

127:1550-1557 ; Kaladin et al . Biokhymiya 1980, 45:644- 
651) , Thermus thermophilics, ou encore des especes du 
genre Bacillus (demande de brevet Europeen publiee sous 
le No. 699 760), Thermococcus (demande de brevet Europeen 

20 No. 455 430) , SulfoloJbus et Pyrococcus (demande de brevet 
Europeen publiee sous le No. 547 3 59) . Parmi ces ADN 
polymerases issues d' archaebacteries on peut citer la 
Pfu, isolees de Pyrococcus furiosus (18), la Vent™ 
polymerase de Thermococcus litoralis (10), la 9°N de 

25 Pyrococcus sp. 9°N (15) et la DeepVent™ de Pyrococcus GB- 

D, les deux premieres provenant de souches du littoral 
(Baie de Naples), les deux suivantes de souches sous- 
marines prof ondes . 

Le mecanisme d* action des ADN polymerases est 

30 aujourd'hui relativement bien connu et consiste en une 
replication de 1 'ADN k I'identique selon un mode semi- 
conservatif. Le brin recopie sert de matrice et les 
quatre nucleotides triphosphates sont le substrat de 
cette polymerisation. Les enzymes ayant une activity ADN 

35 polymerase sont aujourd^ui de plus en plus utilisees in 
vitro afin de travailler en biologie mol^culaire dans 
divers buts tels le clonage, la detection d'erreurs, le 
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sequengage, .le marquage, et de fagon generale, 
1 'amplification de sequences d'acides nucl^iques. 

Cette amplification, in vitro, de sequences 
d'acide d^soxyribonucleique fait appel a la technique de 
5 la reaction de polymerisation en chaine (PCR) decrite 
dans les brevets Europeens No. 2 00 3 62 et 201 184. Le 
principe de cette technique est base sur la realisation 
de cycles successifs d' extension d 1 amorces mettant en 
oeuvre les quatre nucleotides triphosphates ainsi qu'une 

10 ADN polymerase et un ADN matrice a recopier. A chaque 
cycle, 1' enzyme double le nombre de brins d • ADN 
disponibles et entre chaque cycle une thermodenaturation 
est necessaire afin d'ouvrir la double helice d* ADN pour 
le cycle suivant . Les temperatures utilisees pour cette 

15 etape de thermodenaturation ne sont pas compatibles avec 

la conservation de l'activite de la plupart des ADN 
polymerases connues, telle la Klenow. C'est ainsi que des 
nombreux efforts de recherche ont ete realises afin de 
trouver des enzymes supportant ces temperatures. 

20 Cependant, si les micro-organismes thermophiles 

sont aujourd'hui connus, il reste encore difficile 
d'obtenir ces enzymes thermostables avec des rendements 
de production suffisants. La biologie mol^culaire et le 
genie gen<§tique permettent de palier cet inconvenient. 

25 Ainsi, une fois repere dans le genome, le gene codant 
pour 1 1 ADN polymerase est clon6, sequence puis redone 
dans un vecteur d» expression afin de produire la prot^ine 
dite alors recombinante , chez un hdte m^sophile plus aise 
a cultiver tel E . coli ou S. cerevisiae. Cette methode 

30 d' expression chez E. coli a notamment et6 decrite dans la 
demande de brevet internationale PCT publiee sous le No. 
W0 89/06691 pour produire 1 ' ADN polymerase de Thermus 
aquaticus. 

L' ADN polymerase de 1 1 invention provient d'une 
35 archaebacterie de l'esp&ce Thermococcus fumicolans. Outre 
ses propriety thermostables la rendant particulierement 
efficace notamment dans une processus de PCR, cette ADN 
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polymerase est remarquable en ce qu'elle presente deux 
"introns proteiques " , encore appeles " inteines " , au 
niveau de son polypeptide precurseur. 

La sequence nucleotidique de ses inteines est 
5 inseree dans celle de l'ADN polymerase, gen^ralement au 
niveau de sites conserves impliques, apres traduction, 
dans les reactions catalytiques . Ces sequences sont 
transcrites et traduites en meme temps que celle de l'ADN 
polymerase et l'epissage autocatalytique des inteines 
10 produit alors trois enzymes: deux int6ines et une ADN 
polymerase . 

On trouve de telles inteines egalement au sein 
d'autres molecules telles l'ATPase vacuolaire chez S. 
cerevisiae (4), GyrA chez Mycobacterium leprae (7), Rec A 

15 chez Mycobacterium tuberculosis (5, 6). Les inteines font 
partie pour leur majorite de la famille des endonucleases 
de type "homing endonucleases" puisqu'elles coupent l'ADN 
en un site reconnu, a l'endroit m&me ou leur sequence 
nucleotidique vient s'inserer. 

20 Le developpement des biotechnologies tant dans 

la recherche que dans les domaines de la medecine ou de 
l'agro-alimentaire, necessite de disposer de divers types 
d'ADN polymerases susceptibles d'am^liorer 
quantitativement et qualitativement des techniques aussi 

25 diverses que le clonage, la detection, 1 1 amplification de 
sequences d'ADN. La presente invention vise precisement a 
offrir une nouvelle ADN polymerase thermostable qui est 
issue d'une espdce r^cemment d^crite: Thermococcus 
fumicolans (8). Cet isolat a et6 isol£ a partir de 

30 fragments de cheminees pr61ev6es dans le bassin Nord- 
Fidgien lors de la campagne franco- japonnaise STARMER en 
1989. Cette esp£ce, anaerobie stricte, presente une 
temperature optimale de croissance de 90°C, ce qui est 
relativement eleve pour un Thermococcus. Son pH optimum 

35 est de 8,8, et son taux de salinite de 20 g/1 a 40 g/1. 

L ■ invention a done pour objet une ADN 
polymerase purifide thermostable d' archaebacteries de 
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l'espece Thermococcus fumicolans ayant un poids 
moleculaire de I'ordre de 89000 Da ainsi que ses int^ines 
thermostables, dont le gene comportant les deux sequences 
codant pour lesdites inteines a ete clone. 
5 Les travaux de recherche ayant permis 

d' identifier, de sequencer et d'etudier I'ADN polymerase 
de 1' invention ont ete realisee a partir de la souche 
Thermococcus fumicolans ST557 deposee a la Collection de 
l'Institut Pasteur (CIP) sous le numero CIP 104680. Cette 
10 ADN polymerase sera denommee dans ce qui suit Tfu. Sa 
sequence de 774 acides amines est representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 
Un poids moleculaire de 89797 Da et un pi de 8.1 ont ete 
deduits de cette sequence. 

15 

L' invention concerne done I'ADN polymerase 
purifiee thermostable d' archaebacteries de 1 ' espece 
Thermococcus fumicolans ayant un poids moleculaire de 
I'ordre de 89 000 daltons ainsi que ses derives 

20 enzymatiquement equivalents. On entend par derives 
enzymatiquement equivalent, les polypeptides et proteines 
constitues par ou comprenant la sequence en acides amines 
representee dans la liste de sequences en annexe sous le 
numero SEQ ID NO: 2 des lors qu'ils presentent les 

25 propri6t£s de 1 1 ADN polymerase de Thermococcus 
fumicolans. A ce titre 1' invention envisage plus 
particuli&rement une ADN polymerase dont la sequence en 
acides amines est representee dans la liste de sequence 
en annexe sous le numero SEQ ID N0:1 ou un fragment de 

30 celle-ci ou encore un assemblage de tels fragments, comme 
la sequence de 774 acides amines representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 

En effet, la presence de deux inteines I-Tfu-1 
et I-Tfu-2 dans la sequence numero SEQ ID NO:l, sont 

35 susceptibles de conduire lors de la preparation par 
synthese chimique ou par genie genet ique, a des sequences 
d ' ADN polymerase de T. fumiculans tronquees dont les 
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proprieties enzymatiques sont tquivalente a celle de 1 1 ADN 
polymerase de T. fumicolans purifiee. 

On entend aussi par derives, les sequences en 
acides amines ci-dessus modifiees par insertion et/ou 
deletion et/ou substitution d'un ou plusieurs 
aminoacides, pour autant que les propriety de 1 'ADN 
polymerase de T. fumicolans qui en rtsultent ne soient 
pas signif icativement modifiees. 

L • invention concerne egalement une sequence 
d 1 ADN constitute par ou comprenant la sequence codant 
pour une ADN polymerase de 1* invention. 

La sequence d 'ADN represents dans la liste de 
sequences en annexe sous le numtro SED ID NO : 1 
represente une telle sequence. L'ADN codant pour 1 ' ADN 
polymerase de T. fumicolans et ses deux inteines est 
constitute par le nucleotides 357 a 5028. Les nucleotides 
1 a 356 correspondent a la region promotrice de ce gene. 
En consequence, 1 ' invention a pour objet une sequence 
d'ADN constitute par ou comprenant la sequence comprise 
entre les nucleotides 3 57 a 5028 de la SED ID NO: 1, ou 
un fragment de celle-ci ou encore un assemblage de tels 
fragments . 

1' invention se rapporte tout particulierement a 
une sequence d'ADN constitute par ou comprenant les 
nucltotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
la stquence d'ADN reprtsentt dans la liste de stquences 
en annexe sous le numtro SED ID NO: 1. 

Cette stquence code pour 1 'ADN polymtrase de r. 
fumicolans dont la stquence de 774 acides amints est 
reprtsentte dans la liste de stquences en annexe sous le 
numtro SED ID NO: 2. 

L' invention concerne autant 1 1 ADN polymtrase 
isoltes et purifites de la souche Thermococcus fumicolans 
que 1'ADN polymtrase prtpartes par syn these chimique, par 
exemple par ligature de fragments polypeptidiques , ou 
encore par les mtthodes du gtnie gtnttique. 
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Dans le cadre de ces methodes du genie 
genetique, 1' invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
qu'un proced6 de production ou d' expression dans un h&te 
5 cellulaire des ADN thermostables de 1' invention. 

Un proc£d6 de production d'une ADN polymerase 
conforme a 1' invention consiste: 

- a transferer une sequence d'acide nucleique 
codant pour 1 1 ADN polymerase ou un vecteur contenant 

10 ladite sequence dans un hote cellulaire, 

- a cultiver l'hote cellulaire obtenu k l'etape 
precedente dans des conditions permettant la production 
de 1 'ADN polymerase, 

- a isoler, par tous moyens appropries, ladite 
15 ADN polymerase. 

L*h6te cellulaire mis en oeuvre dans les 
procedes precedents peut §tre choisi parmi les 
procaryotes ou les eucaryotes et notamment parmi les 
bacteries, les levures, les cellules de mammiferes, de 

20 plantes ou d'insectes. 

Le vecteur utilise est choisi en fonction de 
l'hote dans lequel il sera transfere. 

L 1 ADN polymerase thermostable de 1 1 invention 
est utile notamment dans les procedes d ' amplification 

25 enzymatique de sequences d'acides nucleiques. En 
consequence, l 1 invention a pour objet, de tels procedes 
mettant en oeuvre 1 1 ADN polymerase thermostable decrite 
precedemment, ainsi que les kits d ' amplification 
comprenant, outre les reactifs g6n6ralement utilises, une 

30 quant ite adequate de cette ADN polymerase. 

L* invention a egalement pour objet une inteine 
purifiee thermostable d 1 archaebacteries de I'espdce 
Thermococcus fumicolans. 
35 Comme indiqu6 precedemment, les inteines sont 

aussi definies comme des introns prot^iques qui sont non 
pas ^pisses au niveau de 1'ARN messager mais au niveau 
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d'une maturation proteique. Elles reinvent done d'un seul 
g&ne traduit et transcrit en une seule etape, et 
constituent des sous produits de la maturation de la 
proteine codee par ce gene (Xu, M.G., Comb, D.G . , Paulus 
5 H., Noren C.J., Shao Y., Perler, F.,1994, Protein 
splicing : an analysis of the branched intermediate and 
its resolution by succinimidine formation. EMBO J . 13, 
5517-5522. ) 

Les inteines sont des endonucleases de 
10 restriction qui ont la propriete de couper l'ADN a 
1'endroit meme oil s'insere leur gene, et en consequence, 
elles peuvent etre consid^rees comme des sequences 
egoistes. 

Les inteines possedent dans leur sequence toute 
15 1 ' information necessaire a leur propre epissage 
puisqu' elles s'epissent dans E. coli . 

II est possible de distinguer quatre grandes 
etapes de maturation proteique : 

- Une premiere etape de formation d'un 
20 intermediate lineaire qui possede une fonction ester. 

Cette reaction est dependante du pH et de 1 9 environnement 
local de cette liaison (nature des acides amines) . Ce 
principe est utilise dans les kits de clonage, 
d' expression ou de purification mettant en oeuvre des 
25 inteines, car un changement de 1 ' environnement provoque 
ou non un episssage. En effet, celui-ci serai t inhibe a 
pH 11 et active k pH 7,5. 

- Une deuxieme etape de transesterif ication 
qui permet de transformer 1' intermediaire precedent et de 

30 d^placer 1'equilibre de la premiere etape. 

La troisi&me 6tape consiste en une 
cyclisation de l'asparagine lib^rant l'int^ine. 

- La quatrieme etape est la stabilisation de la 
proteine mature et la formation d'une reelle liaison 

35 peptidique. 

II est done possible de construire des mutants 
thermosensibles permettant de bloquer 1' epissage 
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proteique aux temperatures d' expression <3 0°C) et de 
l'induire par chauffage. 

Cette possibility de controle de 1 ' epissage 
proteique par la temperature peut-§tre utilisee dans des 
5 vecteurs de clonage avec une sequence codant pour 
l'inteine et des sites de clonage autour. Si la proteine 
a doner et a exprimer est toxique pour l'h6te, on peut 
la doner en deux fragments autour de la sequence 
d'inteine. Ainsi, globalement, le gene a doner est 

10 complet mais il est interrompu par la sequence de 
l'inteine. Lors de 1 ' expression, l'inteine se retrouve 
dans la proteine exprimee, la rendant ainsi inactive. II 
est alors possible par chauffage, a la fin de 
1' induction, de liberer l'inteine par epissage 

15 autocatalytique et ainsi retrouver la proteine clonee 
active. 

Les inteines permettent ainsi de realiser des 
purifications et sont utilises dans des kits selon le 
principe decrit ci-apres. Certains residus autour de site 

20 d' Epissage de l'inteine sont modifies. L' expression de la 
proteine recombinante est realisee a basse temperature 
pour bloquer un eventuel epissage trop precoce. En C- 
terminal de l'inteine est fixe un site ayant une forte 
af finite pour la chitine. Lors de 1' induction, la 

25 proteine clonee est exprimee ainsi que l'inteine et le 
site de fixation k la chitine. La purification est alors 
realisee avec la chitine, sur des colonnes d' affinitd, 
qui retiennent la chitine et aussi l'inteine et la 
proteine clonee, le tout faisant partie de la mSme pre- 

30 proteine. On hydrolyse alors 1'extremite N-terminale de 
l'inteine avec du DTT ou du p-mercaptoethanol pour 
liberer la proteine clonee. 

Les inteines sont aussi des endonucleases de 
restrictions thermostables , qui ont pour site de 

35 reconnaissance l'endroit meme oil s' insure leur g£ne dans 
la sequence "hote" . Elles poss^dent une sequence 
nucl<§ique repetee deux fois (LAGLIDADG) dans la proteine, 
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15 



sequence plus ou moins conservee et qui correspond au 
site actif de reconnaissance et de coupure de l'ADN. Ces 
enzymes semblent aussi avoir besoin de Mg++ pour leur 
activite. 

II convient de remarquer que les deux inteines 
de 1 1 invention sont coexprimees dans E. coli et sont 
autoepissees. Ce qui signifie qu'elle n'ont pas de 
toxicite pour l'hote, a la difference de l'une des 
inteines de Thermococcus litoralis (9), et en consequence 
leur utilisation dans des kits d' expression ou de 
purification est aisee. 

Une premiere sequence d ' inteine selon 
1' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID NO:3. Cette inteine, 
denommee I-Tfu-1, presente un poids moleculaire de 41 409 
Da et un pi de 9,13, deduits de la sequence de 360 acides 
amines de la sequence SEQ ID NO : 3 . 

Une seconde sequence d' inteine selon 
1' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID NO : 4 . Cette inteine, 
denommee I-Tfu-2, presente un poids moleculaire de 44 765 
Da et pi de 9,6, deduits de la sequence de 389 acides 
amines de la sequence SEQ ID NO: 4. 

Comme rappele precedemment, les inteines 
thermostables de 1 ' invention sont utiles notarament dans 
les procedes de restriction d' acides nucleiques et dans 
la mise au point de vecteurs d' expression permettant de 
reduire la toxicite de la proteine a exprimer en inserant 
I'une des deux sequences d' inteines dans la sequence de 
30 la proteine a exprimer. Ceci peut se faire sans 
manipulation de la sequence des inteines si le clonage 
s'effectue chez E. coli, les techniques d' expression 
utilisees ayant demontre leur inocuit^ pour cet organisme 
hote. En consequence, 1 1 invention a pour objet, de tels 
procedes mettant en oeuvre l'une des deux ou les deux 
inteines thermostables decrites precedemment, ainsi que 
les kits d' expression ou de purification contenant l'une 
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ou les deux sequences codant pour les dites int6ines 
thermostables . 

L ' invention concerne egalement une sequence 
5 d'ADN constitute par ou comprenant la sequence codant 
pour une inteine de 1 1 invention . 

Une sequence d'ADN codant pour 1' inteine I-Tfu- 

1 est comprise entre les nucleotides 1675 et 2754 dans la 
sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 

10 code pour 1' inteine dont la sequence en acides amines est 
representee dans la liste de sequences en annexe sous le 
numero SED ID NO : 3 . 

Une sequence d'ADN codant pour 1' inteine I-Tfu- 

2 est comprise entre les nucleotides 3157 et 4323 dans la 
15 * sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 

code pour 1* inteine dont la sequence en acides amines est 
representee dans la liste de sequence en annexe sous le 
numero SED ID NO: 4 . 

L' invention concerne autant ces inteines 
20 thermostables isolees et purifiees de la souche 
Thermococcus fumicolans que des inteines preparees par 
synthese chimique, par exemple par ligature de fragments 
polypeptidiques, ou encore par les methodes du genie 
genetique. 

25 Dans le cadre de ces methodes du genie 

genetique, 1' invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
qu'un procede de production ou d' expression dans un hote 
cellulaire des ADN codant pour les inteines de 

30 1' invention. De tels procedes sont identiques a ceux 
rapportes precedemment pour 1 • ADN polymerase de T . 
fumicolans . 

D'autres avantages et caracttristiques de 
35 1' invention apparaitront a la lecture des exemples qui 
suivent, donnes a titre non limitatifs et concernant le 
clonage, 1 'expression, la caracttrisation et l'activite 
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de l'ADN thermostable de 1' invent ion, et se referant aux 
dessins annexes dans lesquels : 

- La figure 1 represente 1 'hybridation ADN-ADN 
de l'ADN genomique de T. fumicolans digere par diverses 

5 enzymes de restriction et hybride avec les sondes 
GE23ClaI-HindIII et GE23XhoI-SalI . 

- La figure 2 represente la strategie de 
clonage, la structure du gene de l^ADN polymerase de T. 
fumiculans et les produits du gene. 

10 - La figure 3 represente les resultats de 

purification de la polymerase recombinante de T. 
fumicolans apr£s une colonne d'heparine s^pharose, 
visualises par SDS-PAGE. 

- La figure 4 represente les resultats de 
15 purification de la polymerase recombinante de T. 

fumiculans apres une colonne Bleue HTrap n°2, visualise 
par SDS-PAGE. 

- La figure 5 represente les resultats de 
purification de la polymerase recombinante de T. 

20 fumicolans apres une colonne de phosphocellulose , 
visualises par SDS-PAGE. 

- La figure 6 represente les resultats de 
purification de la polymerase recombinante de T, 
fumicolans apres une colonne MonoQ, visualises par SDS- 

25 PAGE . 

- La figure 7 represente les resultats de PCR 
avec l'ADN polymerase de T. fumicolans avec les fractions 
d' exclusion de la colonne MonoQ. 

30 I- Materiel et methods. 

1) Conditions de culture, plasmides e t souches 

utili^eqs. 

Les souches Thermococcus litoralis (DSM 5474 T ) 
35 et Pyrococcus furiosus (DSM 3638 T ) ont ete obtenues 
aupres de la collection du Deutsche Sammlung von 
Microorganismen (DSM) Braunschweig-Stocheim, Allemagne . 
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La souche Pyrococcus sp. GE'ZX a ete isolee de cheminees 
de sources hydrotherapies profondes et a ete fournie par 
G Erauso (CNRS, Station Biologique de Roscoff , France) . 
La souche Thermococcus fumicolans a ete obtenue aupres du 
5 laboratoire de Microbiologie Marine de G. Barbier 
(IFREMER-DRV-VP-CMM) a Brest, France. Cette souche, 
Thermococcus fumicolans a ete obtenue par purification a 
partir de fragments de cheminees hydrothermales 
receuillies dans le bassin nord-Fidgien lors de la 

10 campagne franco- japonaise STARMER effectuee en 1989 a 
2000 metres de profondeur. 

Pyrococcus sp.GE23 a et6 cultivee a 85°C dans 
un milieu 2216S (DIFCO) a un pH de 6,5. 

Thermococcus fumicolans , decrite en 1996 

15 (Godfroy et al.) est cultivee en conditions anaerobies 
dans un milieu contenant les elements suivants : peptone 
2g/l; extraits de levure 0,5g/l; sel de mer (Sigma) 
30g/l; tampon PIPES 6,05g/l, soufre elementaire 10g/l, 
rezasurine lmg/1. Le pH est ajuste a 8,5 par de la soude 

20 5N a 20°C. 

La souche de Escherichia coli SURE (Stratagene, 
La Jolla, Calif.) a ete cultivee dans du milieu LB avec 
le ou les antibiotiques appropries, a 37°C sous 
agitation. Cette souche a ete utilisee comme hote pour 

25 recevoir les constructions primaires a partir des 
vecteurs pUC 18 ou pBluescript. Les souches NovaBlue, 
BL2KDE3) et BL21 (DE3)pLysS (Novagen, Madison, Wi.) ont 
ete cultivees dans du milieu 2xYT avec les antibiotiques 
appropries a 37°C ou 30°C. Ces souches ont ete utilisees 

30 commes h6tes pour les plasmides d l expression. 

2) Jgolement de 1 \ ADN . hvbrir}* t ion et ADM 
recombinants , 

L* ADN de haut poids moleculaire de Thermococcus 
35 fumicolans a ete isole par la methode de Charbonnier 
modifiee (3) . Les cellules ont ete resuspendues dans un 
tampon TE-Na IX, puis lysees a 40°C pendant trois heures 
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avec un melange de N-Lauryl-sarcosine 1%, dodecyl sulfate 
de sodium 1% et 0,4 mg/ml de proteinase K. Apres la lyse, 
une centrifugation a 5000g pendant 10 minutes permet 
d'eliminer les debris cellulaires. L'ADN est extrait par 
5 un traitement au Phenol-Chloroforme-alcool Isoamylique ou 
PCI (25-24-1), puis traite par la RNAse a 5|ig/ml a 60°C 
pendant une heure. Ces etapes sont suivies de deux 
extractions additionelles par PCI et d'une extraction au 
chlorophorme . L'ADN est ensuite precipite a l'ethanol 

!0 absolu a -20°C, puis centrifuge, seche a 1 1 air et repris 
dans un tampon TE-lx. La concentration et la purete de 
cet ADN sont mesurees par spectrophotometrie a 23 0, 260 
et 280nm avec un appareil GeneQuantll (Pharmacia, 
Upsalla, Sweden) . Pour la construction de la mini-banque 

15 genomique en pUC 18 (17), 1 ' ADN a ete totalement digere 
pendant une nuit a 3 7°C par une serie d' enzymes de 
restriction (BamHI, Hindlll, EcoRI, EcoRV, PvuII, Sail, 
Xbal et Xhol) par simples et doubles digestions. Puis les 
fragments d* ADN sont fractionnes sur gel d 1 agarose a 0,8% 

20 dans de TBE-1X et trans feres sous vide sur une membrane 
de nylon Hybond-N+ (Amersham, UK) . Ces membranes ont et6 
hybridees avec des sondes d'ADN preparees par PCR avec 
des amorces specifiques selectionnees a partir des genes 
d • ADN polymerases de P . furiosus , T. litoralis et 

25 Pyrococcus sp. GE23 . Ces sondes sont prealablement 
marquees au P par "random priming" conformement aux 
recommandations du fabricant (Megaprime, Amersham, UK) . 
Deux sondes de P. furiosus ont 6te utilisees, Pfu et Pfu 
F, couvrant respect ivement les regions delimit^es par les 

30 paires de bases 8 a 2316 et 819 a 1915 de la section 
codante du gene de la polymerase comme d£fini par Uemori 
et al. (18) . Deux sondes de T. litoralis, Tli I et Tli T, 
couvrant respectivement les regions delimitees par les 
paires de bases 297 a 1768 et 4631 a 5378, 

35 comme d^fini par Hodges et al . (9). Deux sondes de 
Pyrococcus sp GE23 ont ete utilisees, l'une contenant la 
partie 5' du g6ne (fragment Clal-Hindlll 
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correspondent" aux' srtes' pb v 8 * et ' pb 2r353'~cftr la section 
codante) et 1 ' autre contenant la partie terminale de ce 
meme gene obtenu par PCR (amorces dites d' expression Ndel 
et Sail correspondant aux sites pb -1 et pb 2318, puis 

5 digestion par Xhol et Sail comprenant les bases du n° 
1879 a 2318) . Les fragments positifs ont ete identifies 
par hybridation ADN-ADN (14) . Seules les hybridations 
avec les sondes de Pyrococcus sp. GE 23 ont fourni des 
signaux positifs a 55°C en moins de 24 h d' exposition. 

10 Les sondes issues de T. litoralis et de P. furiosus n'ont 
donne aucun resultat, m§me a 50°C dans un tampon standard 
sans formamide. A partir des hybridations avec les sondes 
de Pyrococcus sp. GE 23, des fragments Hindlll de 1,9 kb 
ont ete selectionnes , puis prepares par une digestion 

15 appropriee de lOOyg d'ADN genomique, purifies dans des 
sacs de dialyse a partir des gels d' agarose, et 
precipites a I'ethanol absolu apres une extraction au 
PCI. Les fragments ont ete ligatures dans un pUC 
18/HindIII dephosphoryle . Les transformations des souches 

20 hotes ont ete realisees par electroporation (Gene Pulser, 
Biorad) . Le criblage des clones recombinants a ete 
effectue par selection a 1 ' ampicilline , alpha- 
complementation sur substrat X-Gal-IPTG puis hybridation 
de colonies selon les techniques standards (12) . La 

25 temperature des hybridations de colonies etait de 55°C 
avec les sondes de Pyrococcus sp GE23, dans un tampon 
standard sans formamide. L'ADN plasmidique a ete isol6 
selon la m£thode decrite par Birnboim et Doly (1), puis 
purifie par chromatographie echangeuse d* anions en phase 

30 solide (Quiagen, Chatsworth, Calif.). Les fragments de 
restriction des plasmides ont et6 purifies sur gel 
d'agarose par la methode du GeneClean (Bio 101, La Jolla, 
Calif.) pour un clonage ult^rieur. 

L'ARNr 16S et 23S de Thermococcus fumicolans a 

35 6t6 amplifie par PCR en utilisant les amorces suivantes : 

- amorce directe Aa: 5 1 TCCGGTTGATCCTGCCGGAA-3 ' 

- amorce reverse 23Sa: 5 1 -CTTTCGGTCGCCCCTACT-3 ' 
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- etape initiale 3 minutes a 94°C suivi de 30 
cycles (94°C, lmin/ 49°C, lmn/ 72°C, 2mn) et, elongation 
finale de 5 mn a 72°C. 

Le produit de PCR a ete clone dans le vecteur 
PUC18 pour sequencage ulterieur. 

3) Seauenca ae des adm 

Les sequences d'ADN ont ete obtenues par la 
methode de terminaison de chaine (13) en utilisant un 
systeme d'analyses automatique d'ADN Applied Biosystems. 
Les deux brins des genes codant pour l'ADN polymerase et 
les deux inteines ont ete sequences en utilisant des 
amorces universelles localisees sur des vecteurs ainsi 
que des amorces internes . 

La sequence d'ADNr 16S a ete realisee sur les 
deux brins, apres clonage (SureClone, Pharmacia, Uppsala, 
Sweeden), en utilisant le kit Hot-Tub (Amersham, UK.) 
afin de lever les compressions. 

L' analyse de sequence a ete realisee avec le 
20 logiciel DNASTAR (Madison, wis., USA) et le programme de 
Genetic Computer Group (University of Wisconsin 
Biotechnology Center, Wis., USA) accessible en ligne sur 
INFOBIOGEN. Les recherches informatisees de similitude 
ont ete realisees avec le programme BLAST, les 
alignements multiples avec CLUSTAL V, et les arbres 
phylogenetiques ont ete etablis selon la methode dite de 
"Neighbour- joining" (11) . 



15 
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4) Construction du rpcombinant- emrimant l'Anw 
30 polymerase de Thermococcux fv micolans 

L'ADN polymerase de Thermococcus fumicolans 
ainsi que ses deux inteines, ont ete exprimees en meme 
temps chez E. coli avec le vecteur d' expression PARHS2 
qui appartient a la famille des systemes d' expression T7 
35 (16) acquis aupres d ' Eurogentec . 

La PCR a ete utilisee pour preparer le fragment 
complet de l'ADN polymerase et des deux inteines en 
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utilisant des • amorces confcenanfc* les w sites'* de' restriction' 
Ndel et BamHI : 

- amorce Tfu Dir : 
5'-TGG GGA TCC ATA TGA TCC TCG ATA CAG ACT ACA TC-3 1 
5 - amorce Tfu Rev : 

5 ' -AAG CTT GGA TCC TCA TTT CTT CCC CAT TTT GAG CC-3 ' 

Le melange reactionnel contenait 1 • ADN 
polymerase GOLDSTAR (Eurogentec, B) , 1 1 enzyme Tag 
Extender (contenant la Pfu de Stratagene) , le tampon 

10 d'extension avec les quatre dNTP (chacun a 0,2mM) et les 
amorces Tfu Dir et Tfu Rev a 50 pmoles dans un volume de 
50ul final. L ' amplification a ete effectuee sur 20 cycles 
: 1 mn 94°C / 1 mn a 54°C et 6 mn a 72°C en utilisant un 
thermocycleur Stratagene 96-gradient. Les fragments de 

15 PCR ont ensuite ete digeres par les enzymes Ndel et BamHI 
puis ligatures aux memes sites du vecteur, retablissant 
ainsi le codon d ' initiation . La construction ainsi 
obtenue a et<§ nommee PARHS2TFU1. Cette construction a ete 
sequencee aux sites de jonction afin de verifier son 

20 integrity par rapport a la sequence de 1 'ADN genomique. 
Les tests d' expression ont ete realises selon le 
protocole suivant: selection des clones recombinants dans 
la souche E. coli Novablue, expression avec la souche 
BL21(DE3)pLysS dans un milieu 2xYT et induction de quatre 

25 heures a ImM d'IPTG. 

Les premiers essais d' induction ont et6 
realises sur des cultures de 5 ml, induites ou non. Des 
precultures de nuit sont realisees sans inducteur et 
relancees dans un milieu frais le matin (au dizieme) , 

30 jusqu'a ce que la densite optique (mesuree a 600nm) soit 
de 0,6, puis soit induites pendant 4 heures, soit non 
induites et arrdtees au bout de 2, 4 ou 14 heures. Quatre 
ml de cultures sont alors centrifuges a 4°C, 5000rpm 
pendant 10 minutes. Le culot est ensuite repris dans un 

35 tampon de lyse (Tris-HCl lOmM pH 7,5; NaCl lOmM, MgCl2 2 
mM) . Les cellules ainsi reprises sont alors lysees, soit 
avec du triton X-100 1% v/v, soit du lysozyme a Img/ml de 
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lyse ■■- et laissees^ sur. glace- environ* 5' a> 10* min. Les" 
cellules sont ensuite thermodenaturees par une exposition 
de 20 min a 72 °C. Ceci permet de detruire en grande 
partie les cellules de l'h6te mesophile sans detruire les 
5 proteines recombinantes . Le produit de lyse est ensuite 
centrifuge 20 min a 10 OOOrpm h 4°C. Le surnageant est 
recupere afin de le tester en incorporation, en PCR ou 
sur gel. Les incorporations sont realisees suivant deux 
techniques : 

10 - Avec de la thymidine tritiee comme traceur. 

L' incorporation est realisee sur du thymus de veau active 
(SIGMA Aldrich, F) dans le milieu de reaction suivant: 
Tris-HCl 50mM pH 8,8 ; DTT ImM ; MgCl2 10mM ; KC1 lOmM ; 

BSA 0,4 mg/ml; chaque dNTP a 0,4 mM. 

3 2 

15 - Avec du P -dATP (Amersham) comme traceur. 

L' incorporation est realisee sur de l'ADN thymus de veau 
active (Appligene) dans le milieu de reaction suivant: 
Tris-HCl pH 9 50mM; KC1 50mM; MgCl2 7mM; BSA 0,2mg/ml et 
(NH4+)S04 (filtre) 16mM, avec un melange des 4 dNTP a 

20 SOOpM final chacun. Cette seconde methode permet 
d'es timer avec precision le nombre d' unites d' enzyme. 

5) Purification. 

25 a) Culture. 

Apres des essais en petits volumes, les 
cultures destinees a 1' expression de 1' enzyme 
recombinante ont et6 realisees comme suit: production 
d'un inoculum de 700 ml (milieu 2x YT complemente en 

30 ampicilline et chloramphenicol) cultive a 30°C jusqu'a 
DO = 0,8; ensemencement d'un fermenteur contenant 16 1 du 
m§me milieu; culture pendant 4 h jusqu'& DO= 0,6, puis 
induction a l'IPTG 1 mM et culture pendant 4 h. La 
biomasse resultante est centrifugee 20 mn a 6 000 rpm a 

35 4°C (Centrifugeuse JOUAN) . 
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W. frvs-e- cellulaire. et. premise., etape d& 

20 g de biomasse sont repris dans 80 ml de 
tampon (20 mM Tris-Cl pH 7,5; 10 mM NaCl; 2 mM MgC12; 1 
5 mM EGTA ; 1% Triton xlOO; 2,2 mM PMSF) . Le melange 
resultant, maintenu a 4°C maximum, est sonique a 12 
reprises successives (cycle de 15 s) jusqu'a obtention 
d'une solution liquide. Le surnageant est ensuite 
centrifuge 20 mn a 4°C k 20 000 rpm (SORVALL Ti45) . Le 
10 surnageant est recupere et traite par la chaleur (70°C 
pendant 10 mn) afin de thermodenaturer l'essentiel des 
proteines natives de E. coli, puis centrifuge a nouveau. 

c) Chromatoaraphie . 

15 Les 70 ml de surnageant issus de l'etape 

precedente sont charges sur une colonne Pharmacia 
Heparine Sepharose (30 ml de resine) , apres equilibration 
avec un tampon A (10 mM Tris-Cl pH 7,5; 0,5 mM EGTA; 5 mM 
MgC12; 10 mM p-mercaptoethanol ; 0,2% Triton xlOO et 10% 

20 glycerol. Un lavage est effectue avec un tampon B (idem 
tampon A + 2 M NaCl) a raison de 0,3 ml/mn sur un systeme 
FPLC Pharmacia, Les diff^rentes fractions sont recuperees 
en gradient de NaCl. 

Les fractions actives ainsi recuperees sont 

25 dialysees pendant 5 h contre un tampon C: 10 mM Tris-Cl 
pH 7,5; 0,5 mM EGTA; 5 mM MgC12 ; 10 mM -mercapto^thanol ; 
0,2% Triton xlOO; 10% glycerol; 50 mM NaCl. Les produits 
issus de dialyse sont success ivement charges sur une 
colonne d'af finite pour les proteines se liant k l'ADN 

30 (Pharmacia, Bleue HiTrap) et elues en gradient de NaCl 
avec les m§mes tampons que pr6c6demment . 

30ml de fractions actives obtenues precedemment 
sont charg6es sur une colonne de phosphocellulose avec de 
la resine Pll de Whatmann ( volume :20ml; diam^tre: 

35 2,5cm). Ces fractions ont 6te dialysees 5 heures contre 
le tampon suivant : KP04 pH7 20mM, EDTA 0,lmM, DTT ImM, 
Glycerol 5%, Triton X-100 0,1% et KC1 0,1M. Le d6bit de 
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la colonne est regie a 0,2ml/min, le tampon A de 
chargement est compose de KP04 pH7 20mM, EDTA 0,lmM, DTT 
ImM, Glycerol 5%, Triton X-100 0,1% et le gradient (entre 
0% et 50% deB) est realise par le KC1 present dans tampon 
B a 2M. 

Ayant deja mis en evidence que cette polymerase 
ne se fixe pas sur une MonoQ ou une ressource Q et ce, 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en faisant l'hypothese d'une 
fixation de l'ADN contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
de la deuxieme Bleue HiTrap avec un aliquot de 5ml et 
dialyse selon la meme methode que pour un passage sur une 
Bleue HiTrap. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
plus actives 45, 46 et 49. Les fractions sont tout 
d'abord chauffees 40 min a 85°C. Une premiere dialyse est 
alors realisee contre le tampon KC1 0,lmM, K 2 HP04 1M 
pH7,5 pendant 3 heures . La deuxieme dialyse est realisee 
avec le tampon suivant : K2HP04 pH 7,5 lOmM, K2P04 lOmM, 
KC1 25mM, DTT ImM, Triton X-100 0,1%, Glycerol 10%, 
pendant 1 heure. La solution est alors chargee sur une 
colonne MonoQ a 0,5ml /min avec un gradient en NaCl de 0 a 
25 20% (tampons utilises pour l'Heparine) . 

6 > Activites exonurA^pir^^ 

Les tests d' exonuclease 3 '-5' sont quantifies 
par la liberation de nucleotides marques au 32 P 

30 A cett e fin, une premiere etape permet de 

realiser le marquage: l'ADN de est digere par Hindlll 
puis, le fragment de Klenow recopie l'ADN a partir des 
extremites 3 ' -OH libres , dans un milieu contenant outre 
le tampon, l'ADN et 1 'enzyme, du 32 P dATP et du 32 P dTTP, 

35 les dGTPet dCTP etant froids. Apres une heure a 37°C, les 
quatre dNTP froids sont rajoutes en exces pour une demi- 
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heure.. La Klenow. e t , les* dNXP.. . sont diamines^, par. -une. 

extraction au phenol et precipites a l'ethanol. 

Les tests exonucleasiques sont effectues dans 

des solutions contenant les tampons des enzymes, 
5 0,02mg/ml d'ADN marque, et incubees toute la nuit a 72°C, 

80°C et 95°C. Differents tampons contenant du MgCl2 ou du 

MnS04 sont testes. Le meme test est realise avec la Vent 

en temoin positif . 101 de solution de reaction sont alors 

deposes sur papier DE81 (Watmann) , seches puis comptes 
10 avant et apres lavage (3 fois 5 min avec du Na2HP04, 1 

fois a l'eau puis a l'ethanol a 95%) en utilisant la 

technique de Cerenkov. 

Pour le test d'actvite exonucleasique 5'-3', la 

reaction de marquage utilise la polynucleotide kinase 
15 afin de marquer le substrat en 5' . 

II - R^suJ^atg, 



1) implement du gene de 1'adn polymerase dg 
20 Thefmococciip jjMi£&l&12£ ainsi q ue des deux aeneg 

L'ADN de Thermococcus fumicolans , digere par 
une serie d' enzymes de restriction, a ete hybride a des 
sondes de P. furiosus et T. litoralis, preparees par PCR 

25 et aux sondes de Pyrococcus sp. GE23 obtenues lors du 
clonage de cette autre ADN polymerase (Depot de brevet 
n°96 08631 aupres de 1'INPI). Comme montre dans les 
figures la et lb, 1' hybridation de type Southern blot a 
revele des fragments de deux types : un fragment Hindlll- 

30 Hindu I de 1,9 kb et un fragment Xhol-Xhol de 5 kb. Ces 

deux fragments ont ete reveles uniquement avec la sonde 

Clal-Hindlll du gene de Pyrococcus sp. GE23, marquee au 
3 2 

P avec une exposition de deux heures . Les deux 
fragments reperes ont ensuite ete recuperes et purifies 
35 comme decrit prec^demment dans Materiel et Methodes puis 
clones dans le vecteur pUC18 dephosphoryle et digere par 
Hindlll ou dans le vecteur pBluescript dephosphoryle et 
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digere par Xhol. Environ 400 recombinants (E. Coii SURE) 
ont ete cribles avec la sonde Clal-Hindlll . Sur ces 400 
colonies, deux ont donne un signal positif lors de 
1' hybridation. (n° 9.26 et 12.79). Les deux clones ont 
et6 mis en culture en milieu LB -Amp et leurs profils de 
restriction etaient identiques, avec un insert de 1,8 kb. 
Le sequengage ulterieur de 1'un de ces clones (designe 
557MACa) et la comparaison de sequence (Megalign, 
programme DNASTAR) ont montre qu'il correspond a la 
region promotrice et aux 1404 premieres paires de base 
d'un gene d'une ADN polymerase appartenant a la famille B 
(2) . 

En ce qui concerne le fragment Xhol-Xhol de 
5 kb, 700 recombinants ont ete cribles sans aucun signal 
positif lors de 1 'hybridation . Cette absence de reussite 
pourrait etre due a la presence d'une inteine au sein de 
ce fragment, le rendant alors instable dans un vecteur a 
haut nombre de copies de type pBluescript. 

Apres 12 heures d' exposition, un deuxieme 
20 fragment Hindlll-HindHI de 2 kb a et6 repere par 
hybridation de type Southern sur la meme membrane que 
precedemment , en utilisant comme sonde marquee la fin du 
gene de Pyrococcus sp. GE23 entre les sites Xhol et Sail 
(fragment obtenu par digestion de produit de PCR) . Ce 
25 fragment a ete clone comme precedemment. Environ 200 
clones recombinants ont ete cribles et quatre d' entre eux 
ont donne un signal positif. Les quatres clones ont un 
profil identique apres digestion par 1 ' enzyme de 
restriction Hindlll. L'un d'entre eux, 557MACc, a 6te 
sequence et la comparaison de sequence a d&nontre qu'il 
s'agissait de la fin du gene de 1 'ADN polymerase 
precedemment identifiee. 

Supposant que les fragments de genes obtenus 
appartenaient a la meme ADN polymerase, des 
oligonucleotides ont 6t6 utilises afin d'amplifier la 
zone manquante. Ce fragment de PCR a ensuite ete purifie 
sur gel comme decrit dans Materiel et Methodes, et 
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utilise coirane sonde marquee radioactivement pour reperer 
sur la membrane le fragment manquant. Apres deux heures 
de revelation un fragment Hindi I I -Hindi I I a ete revele, 
de 2 kb environ. Clone comme precedemment , 600 colonies 
ont alors ete criblees, dormant quatre clones positifs. 
Les quatre clones avaient le meme profil et l'un d'entre 
eux, nomme 557MACb a ete sequence et les comparisons de 
sequences ont demontre qu'il s'agit de la partie 
intermediate de l'ADN polymerase et ce fragment, 
delimite par deux sites Hindlll, s'insere parfaitement 
entre 557MACa et 557MACc. L ' ensemble de ces trois clones 
donne la sequence complete de l'ADN polymerase de T. 
fumicolans . 

2) Position phvlogpnetimiP d e < njSESSQ £0£SliS. 

fumicolans 

Thermococcus fumicolans est une nouvelle espece 
de Thermococcales decrite par Godfroy et al (8) 

3) Sequences nucleoti cliques e<- n olvnenH Hi qi^ p 
de l'ADN polymerase rle Thexmocnrrus frnninmar,* 



a > Sequenc es nuclfV>tidiques 

Les trois fragments delimites par des sites 
Hindlll ont ete assembles ( figures 2 et 3 ) . lis forment a 
eux trois un fragment de 5039 paires de bases. Le premier 
fragment, issu du clone 557MACa, contient le codon de 
depart ATG en position 457 pb. La phase ouverte de 
lecture est alors ininterrompue sur 4572 paires de bases 
jusqu'a rencontrer un codon STOP sur le fragment issu du 
clone 557MACC en position 5028 pb, six paires de bases 
avant le dernier site Hindlll. Par alignement, avec les 
autres genes d'ADN polymerases disponibles en banques 
(Pfu, Tli, GB-D, KOD, ..), avec la methode CLUSTAL V, 
35' completee par un alignement manuel final necessaire pour 
restituer les sites d' autoepissage des inteines, deux 
sequences d' insertions ont ete mises en evidence. 
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- La premiere est inseree a la paire de base n° 
1675 et se termine a 2754, etant ainsi repartie entre le 
fragment issu du clone 557MACa et celui du clone 557MACb. 

- La deuxieme est inseree a la base n° 3157 et 
se termine a 4323. Elle est, de mime, repartie entre le 
clone 557MACb et 557MACc. 

Ces deux sequences d' insertions forment, avec 
le reste de la sequence codant pour l'ADN polymerase, un 
seul cadre de lecture. 

b ) Sequenc es polvneptidicnifts: 

La section codante du gene de l'ADN 
polymerase est done constitute de trois parties 
disjointes. La premiere partie du gene, portee par 
557MACa, comporte la zone codant pour 1 ' exonuclease 3'- 
5', ou apres traduction, onreconnait le motif FDIET. La 
deuxieme partie, portee par 557MACb et la troisieme 
partie portee par 557MACC comprennent les sites conserves 
SLYPSI, et YG.DTD. 

Les deux sequences d' insertion sont situees 
sur des zones conservees de l'ADN polymerase, la premiere 
au site DFR/SLYPSII come I-KOD-1 de Pyrococcus sp. K0D1 
et la deuxieme au site D/TDG comme I-Tli-1 de T 
litoralis. Ces deux proteines sont liberees par 
autoepissage proteique. Elles comportent les sites de 
type LAGLIDADG repetes deux fois a 100 paires de bases de 
distance environ. Les alignements avec les autres 
inteines deposees dans les banques de sequences 
permettent de les assimiler a des endonucleases de 
restriction de type archaebacterien, endonucleases qui 
coupent l'ADN a l'endroit precis ou leur gene s'insere. 

c) Comparaispn avec les autrss g e cnienr^p rl'in* T 
polymerases 

L'alignement des differentes sequences 
polypeptidiques des ADN polymerases de Thermococcales 
disponibles en banque, P. abyssi strain GE5, Pyrococcus 
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sp. GE23, Pyrococcus sp. KOD1, Pyrococcus sp. GB-D, P. 
furiosus, Pyrococcus sp 9°N, T. litoralis avec la 
sequence de T. fumicolans (sans inteines) , realise avec 
le programme CLUSTAL utilisant la matrice PAM250, donne 
5 les niveaux de similarite entre ces diverses polymerases 
figurant au tableau 1 ci-dessous. 

Tableau 1 



Espece 


1 


2 


3 


4 


5 


6 


7 


8 


1 - T. fumicolans 


xxx 


81,7 


89,3 


77,6 


77,3 


80,0 


79,3 


90,6 


2 - P. sp. GB-D 




xxx 


81,3 


85,1 


76,9 


89,0 


88,1 


82,6 


3 - P. sp. KOD1 






xxx 


78, 8 


77,5 


80,7 


79,9 


90,3 


4 - P. furiosus 








XXX 


73,9 


83,3 


82,5 


79,6 


5 - T. litoralis 










XXX 


75,9 


75,0 


76,5 


6 - P. sp. GE23 












xxx 


98,7 


80,9 


7 - P. abyssi 














xxx 


80,2 


8 - P. sp. 9°N 
















xxx 



Le niveau de similarite le plus proche est 



10 celui observe avec Pyrococcus sp. 9°N (90,6%), ce qui 
indique clairement que l'ADN polymerase de T, fumicolans 
est originale au niveau de sa sequence et constitue de ce 
fait une nouvelle ADN polymerase. 

15 d) CQmpfriTfligon <fes inteines avec les autres 

inteines disponibles dans les bancmes. 

Les sequences disponibles en banque ont ete 
alignees selon les memes methodes que precddemment . Les 
comparaisons de 1' ensemble des inteines demontrent que 

20 celles-ci sont reparties en trois groupes correspondant 
aux sites d'insertion des motifs A (R/SLYPSI) , B 
(KILAN/S) et C (D/TDG) ♦ L'analyse des niveaux de 
similarite et la recherche de relations phylog6n<§tiques 
n'ont de sens que pour des inteines appartenant a la meme 

25 classe, c'est k dire s'inserant dans un motif donne. Les 
niveaux de similarity pour I-Tfu-1 (classe A) et I-Tfu-2 
(classe C) avec leurs inteines homologues dej& ddcrites 
sont donnas respectivement aux tableaux 2 et 3 ci- 
dessous. 

30 Tableau 2 
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1 


2 


3 


1 


I-Tfu-1 


XXX 


41,4 


75,3 i 


2 


I-Mia-1 




XXX 


51 f 7 


3 


I-KOD-1 






XXX 





1 


2 


1 


I-Tfu-1 


XXX 


62,2 


2 


I-I-Tfli-2 




XXX 



10 



I-Tfu-1 et I-Tfu-2 semblent representer deux 
nouveaux "alleles" des "homing" endonucleases 
archaebacteriennes des classes A et C. 

I-Tfu-1 est le troisieme allele connu d'inteine 
s'inserant au site A des ADN polymerase d'Archaea, tandis 
que I-Tfu-2 est le second de sa classe. 

5) Expression, caracterisafi o n sf. yit£ ^ 

1'ADN polymerase A* T fvminnl^ 

a) Clonaoe et emrpsai^ 
15 Un insert de 4595 pb obtenu par PCR longue- 

distance avec les amorces TfuDir et TfuRev et couvrant la 
totalite du gene de 1 'ADN polymerase de Thermococcus 
fvmicolans, avec les deux inteines, a ete clone aux sites 
Ndel et BamHl d'un vecteur pour transformer la souche E. 
20 coli Novablue. Des mini -preparations d' ADN plasmidique 
ont ete realisees sur une dizaine de clones trans formants 
et ont toutes donne un signal positif a 1' hybridation. 
Deux clones ont ete retenus sur la base de leur profil 
apres une digestion par Ndel et Sail ou par Hindlll. Ces 
deux plasmides ont ensuite ete transformes dans la souche 
E. coli BL21(DE3)pLysS. 

Des essais d' expression ont ete realises en 
culture de 5 ml afin de determiner les conditions 
optimales de culture et d' induction. Tout d'abord les 
essais de cultures ont ete realises a 37°C, ou l'on 
observe une lyse cellulaire trop importante, puis a 30°C 
ou la culture ne lyse pratiquement pas. La culture est 
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realisee- en- mi-Heu' -2xYT7' ou le rendement de produc tion 
est meilleur et la lyse reduite, supplemente avec de 
l'ampicilline (100ng/ml) et du chloramphenicol (15ug/ml) . 
L» expression est alors induite en phase exponentielle de 
croissance (DO600nm = 0,6 a 0,7) avec une concentration 
en IPTG de ImM, concentration qui s'est averee optimale. 
Des echantillons soht preleves avant induction puis 2 
heures. 4 heures et 6 heures apres induction, ainsi 
qu' apres une nuit. Des prelevemments sont aussi realises 
sur les cultures non induites apres 6, 8, 12 et 24 heures 
de culture. 

Les echantillons sont alors traites comme 
indique au chapitre Materiel et Methodes, afin de tester 
le niveau d' activite de l'ADN polymerase recombinante par 
15 incorporation de thymidine tritiee ou de 32 P dCTP. Cette 
premiere technique, qui permet une approche qualitative, 
nous donne deux types de comportement. Un des clones est 
non inductible et la meilleure activite est obtenue apres 
une nuit de culture (clone rTful-1) . Un second clone est 
inductible et presente une activite maximale apres quatre 
heures d' induction, activite qui diminue par la suite 
(clone rTful00-2). Deux autres clones, aussi testes sont 
faiblement inductibles et expriment tres peu l'ADN 
polymerase . 

Les clones rTful-1 et rTful00-2 sont ensuite 
testes en erlenmeyer de 50 ml dans les conditions 
decrites precedemment . Seul le clone inductible rTful00-2 
a une expression constante en volume de 50 ml. La suite 
des travaux a done ete realisee sur ce clone. 
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b > Fermentation et-. fraction H Pff cellule 
La culture du clone Tful00-2 a ete realisee 
dans un fermenteur de 16 litres, dans le milieu 2xYT 
supplemente en ampicilline et chloramphenicol . La 
preculture, de 750ml a ete realisee la veille et arretee 
en phase exponentielle (DO 600nm= 0,7-0,8) et laissee a 
4°C pour la nuit. Le fermenteur a ete prepare et mis en 
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temperature . a 30°G avec le- milieu de culture. La 
preculture a ete remise a 30°C une heure avant son 
transfert dans le fermenteur. Le volume final de culture 
est de 15 litres. Les conditions sont les suivantes : 
temperature = 30°C ; agitation = 300 rpm. L'induction 
avec 1 mM d'IPTG a ete realisee a DO 600 = 0,58. Le pH de 
la culture a ete regule a 7 pendant la phase 
d' acidification puis laisse libre lors de la phase 
alcaline. Les bacteries ont ete prelevees apres quatre 
heures d' induction, alors que le pH etait de 8,3. La 
culture a ensuite ete centrifugee puis les cellules ont 
ete divisees en trois lots. L'un d'eux, 20 g de pate, a 
ete repris dans 80 ml de tampon de lyse pour un 
traitement ulterieur indique au chapitre Materiel et 
15 methodes . 

c) Purification dg VADN PO Wr„ a de Z 
funucolans. 

La purification a ete .effectuee comme indique 
precedemment (Materiel et Methodes). Pour la colonne 
Heparine -Sepharose, un gradient de 3 a 50% de tampon B, 
correspondant aux volume 3 65 ml a 13 63 ml, permet de 
recuperer 73 fractions de 6 ml . Le pic d'activite de la 
polymerase est obtenu pour une valeur de gradient de 0,5 
M environ, et correspond aux fractions 55/56 (dosees a 
10 et 12 unites respectivement) comme indique a la figure 
7. Ces fractions, incubees a 37°C pendant la nuit en 
presence d'ADN de pBR322, degradent 1 ' ADN et presentent 
en consequence des traces de nuclease de l'hote, non 
visibles sur gel. Leur elimination, ou tout au moins une 
reduction substancielle de leur concentration a ete 
realisee par un passage sur colonne d'af finite (Bleue 
Hi trap) . 

Les fractions 54 a 60, regroupees et dialysees, 
sont chargees a raison de 0,25 ml/mn. L'elution permet 
de recuperer 65 fractions de 5 ml avec des pics 
d'activite pour les fractions 36 a 56. Le dosage de 
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l'activite fait apparaitre une concentration de 3 k 5 
unites, pour. le& fractions** 3& a- 40-.* Ges- fractions; mises 
en presence d'ADN a 37°C, pressentent une faible activite 
nucleasique. 

N6anmoins, l'activite sur le plasmide pBR322 a 
37°C toute la nuit montre une nette amelioration de la 
purete de 1' enzyme. Une deuxieme colonne Bleue Hi Trap a 
ete reutilisee en prenant les fractions 36 a 44 et 
dialysees comme pr£cedemment . 25ml sur les 30ml de 
fraction ont ete injectes sur la colonne avec un debit de 
0,25ml/min (5 ml etant gardes pour essayer une MonoQ) . 
Apres cette deuxieme colonne Bleue HiTrap, l'activite sur 
le plasmide pBR322 ferme et incube toute la nuit avec des 
fractions de la colonne, est nulle. L' incubation d'une 
heure a 72°C de fractions avec l'ADN de Lambda digere par 
Hindlll montre une tres nette degradation, mettant en 
evidence l'activite exonucl6ase 3 '-5' associee a notre 
ADN polymerase. Le pic d' activite se situe entre les 
fractions 27 et 32. L'ADN polymerase plus pure est done 
20 sortie plus t6t sur le gradient de NaCl . Sur les 
fractions les plus actives, un comptage a 6te realise 
donnant une activite superieure k 5U/ul pour les 
fractions 29, 30 et 31. La figure 4 montre le resultat 
sur gel SDS-PAGE. Suite a ces trois colonnes, la purete 
25 de la polymerase est nettement amelioree. Neanmoins, il 
reste des traces d'ADN de E.coli fix6 k la polymerase et 
mises en Evidence par PCR. Deux colonnes suppl&nentaires 
vont done §tre mis en oeuvre. 30ml de fractions actives 
obtenues prec^demment sont chargees sur une colonne de 
30 phosphocellulose (celle-ci devrait fixer differemment 
l'ADN et la polymerase). L'activite de la polymerase est 
reper^e par son activite exonucleasique 3 '-5' elevee a 
72°C sur l'ADN de Lambda dig6re par Hindlll. L'activite 
la plus forte se situe entre les fractions 40 et 49 avec 
35 un pic net en 46 et 47. Sur ces fractions 40 a 49 l'ADN 
de pBR322 est intact apres une nuit a 37°C. La figure 5 
nous montre les r£sultats sur gel avec des activites 
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mesurees de 6U/ul pour la fraction 46, 4,5U/ul pour la 47 
et 3U/UX pour la 48'. Neanmoins il reste encore des traces 
d'ADN de E. coli. 

Ayant deja mis en evidence que cette polymerase 
ne se fixe pas sur une MonoQ ou une ressource Q et ce 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en esperant une fixation de l'ADN 
contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
de la deuxieme Bleue HiTrap avec 5ml dialyses Les 
resultats ont ete decevants, les fractions d' exclusion 
etant peu actives en incorporation. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
15 plus actives 45, 46 et 49. Les fractions sont tout 
d'abord chauffees 40 min a 85°C en raison d'une detection 
de contaminant degradant le pBR322 a 72°C en une nuit. 
Aucune floculation n'est alors visible et l'extrait est 
mis sur glace. Un nouveau test demontre que la 
contamination semble reduite. Apres les dialyses et le 
passage sur colonne, l'activite exonucleasique est mise 
en evidence sur les fractions d' exclusion 3 a 7. 
L'activite est dosee a 2U/ul et 1' enzyme est visualisee 
sur la figure 10. Suite a cette derniere etape de 
25 purification, nous avons obtenu des resultats positifs en 
PCR et comparables a ceux obtenus pour la Vent. 

d > Ca ^ ra ^ cteffisation des activity ^ fractinns 

purifiees . 
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L'activite de l'ADN polymerase des differentes 
fractions a ete dosee par incorporation au 32 p dATP selon 
le protocole decrit en Materiel et Methodes. 

- Amplification A* genes jg yif - r-f 
Un fragment de 459 pb a ete amplifie a partir 
d'un ADN genomique d' Archaebacterie (Thermococcus sp. GE 
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8) avec des..amor,ces.^ S peeif iquesV-Dif f erents' tairpons ont 
ete utilises: 

- tampon lOx R : Tris HC1 pH 8,8: 300mM; KC1 : 
500mM; MgC12 : 30mM; Tween 20: 0,1% 

5 - tampon lOx H: Tris HC1: pH 8,8: 300 mM; KC1: 

500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx T: Tris HC1 pH 8,8: 600mM; KC1 : 
500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx S: Tris Hcl pH 8,8: 200mM; KC1 : 
10 250mM; MgC12 : 20mM; Tween 20: 0,1% 

Trente cycles ont ete realises, chacun 
comprenant une etape de denaturation a 94°C pendant 30 
sec, une etape d'hybridation des amorces a 51°C pendant 
1 min. puis une etape d'elongation a 72»C pendant 2 min. 
La figure 8 presente les resultats obtenus avec un volume 
reactionnel de 50 m pour des quantites d' AON polymerase 
de Thermococcus fumicolans de 2,7 unites. En l'etat 
actuel, les meilleurs resultats avec la Tfu sont obtenus 
avec le tampon R. 

La figure 9 represente les resultats de 
1' amplification d'un fragment de 1,6 kb avec la Tfu 
purifiee sur colonnes d'heparine puis de sephacryl-bleue, 
et un tampon reactionnel lOx ayant la composition 
suivante: Tris HC1 pH 8.8: 200mM; KC1: lOOmM; (NH4) 2 S0 4 : 
25 lOOmM; MgS04 : 20mM; Triton X-100 : 1%. 

" Activite exonuff14 a | c:irp,o | 

Les tests d'activite, selon le protocole 
detaille en Materiels et Methodes, ne revelent pas 

30 d'activite exonucleasique 5'-3< chez la Tfu. Ceci est en 
conformite avec la structure de 1 < enzyme deduite de 
1' analyse de la sequence polypeptidique qui ne fait pas 
apparaitre de domaine fonctionnel exonuclease 5 '-3', 
contrairement a ce qui est observe pour DNA poll de E. 

35 coli et la Taq. 

Les tests d'activite, selon le protocole 
detaille au chapitre Materiels et Methodes, font 
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apparaitre une activite exonucleasique 3 '-5' (activite 
proof-reading ou-de- correction d'erreurs) chez la Tfu, a 
un niveau sensiblement egal a celui de la Vent conune 
montre dans le tableau 4 ci-dessous. Le tableau 4 
rapporte la mesure de l'actvite exonucleasique 3 '-5' de 
la Tfu en fonction de la concentration en dNTP, et en 
comparaison avec la Vent. 

Tableau 4 



Cone. dNTP 
(mM) 


Tfu 


Temoin + 
(Vent) 


Temoin - 
(Pab exo-) 


0 


30 000 


25 000 


100 000 


0,1 


40 000 




0,2 


40 000 


56 000 




0,3 


40 000 


58 000 




0,4 


40 000 


70 000 




0,5 








0,75 


40 000 


84 000 




1 


90 000 


106 000 


100 000 



Ces resultats sont en conformity avec la 
structure de 1' enzyme deduite de 1' analyse de la sequence 
polypeptidique qui revele la presence d'un domaine 
exonucleasique 3 '-5' en position N-terminale, ainsi que 
la presence des motifs catalytiques caracteristiques de 
ce domaine. La Tfu est sensible a une concentration de 
l'ordre de 0,8 mM de dNTP, tandis que la Vent manifeste 
une sensibilite des 0,5 mM. Cette activite est connue 
pour ameliorer in vitro la fidelite des polymerases 
utilisees en PCR. 

En outre, cette activite exonucleasique est 
confirmee par un test plus simple. Les fractions 
purifiees, depourvues d' activity nucleasique a 37 °C, 
mises en presence d'ADN de digere par Hindlll puis 
expose a 72°C pendant la nuit, degradent completement cet 
ADN, mettant ainsi en evidence la presence de 1' activite 
3 '-5' exonuclease de la Tfu ainsi que sa 
thermostabilite . 



- Thermostahi 1 i t-* 
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La thermostabi'lite mesuree- selon" le protocole 
decrit precedemment (Materiel et Methodes) , ou mieux, 
l'activite residuelle en incorporation a 72°C apres 
exposition de 1' enzyme a des temperatures elevees pendant 
des temps variables, est donnee dans le tableau 5 ci- 
dessous . 

Tableau S 



Teitperature 
(°C) 


Demi -vie 
polymerase 


Activite exo 
apres 3h 


92 




100% 


95 


4 h 




100 


2 h 





—^^.i^uc, iiii Btl eure a ceiie des 

polymerases issues d'organismes plus hyper thermophiles 
tels que les Pyrococcus, n'en demeure pas moins tres 
largement superieure a celles des polymerases issues des 
Thermus et en particulier toutes les Taq. La 
thermos tabilite de 1 'enzyme recombinante purifiee, tant 
pour le domaine polymerase que pour l'exonuclease, est de 
toute maniere tres largement superieure a tous les 
besoins connus en PCR. 
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LISTE ; DE- SEQUENCES " 

(1) INFORMATION GENERALES : 

(i) DEPOSANT : APPLIGENE - ONCOR 

( i i ) TITRE DE L ' INVENTION : ADN POLYMERASE 
THERMOSTABLE D ' ARCHAEBACTERIES DE L ' ESPECE 
THERMOCOCCUS fumicolans 

(iii) NOMBRE DE SEQUENCES: 4 



(2) INFORMATION POUR LA SEQ ID NO : 1 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 5039 paires de bases 

(B) TYPE : nucleotide 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ■ ADN 
polymerase de THERMOCOCCUS fumicolans Tfu 

(B) EMPLACEMENT : de 457 a 5028 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ■ inteine 
I-Tfu-1 

(B) EMPLACEMENT: de 1675 a 2754 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ' inteine 
I-Tfu-2 

(B) EMPLACEMENT: de 3157 a 4323 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: codon stop 

(B) EMPLACEMENT: de 5026 a 5028 

(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO : 1 • 



AGCTTAAAGC 


GTCCGCCACT 


ACTTCCTGAA 


AGCTCACGCG 


GTAAAACAGC 


TCCATGCTCG 


60 


GCTCTTCGAT 


GGGAGGTTTA 


AAAAGGTGGT 


GGTGAGGTTT 


ATTAGGAAGA 


AGGCTCAACT 


120 


AGAGACGGTG 


GGAGTATGGA 


AGAGGTCGAC 


AGGCTCGTGT 


TCAACTTTCC 


CCTCTTCAAA 


180 


GATTACTGGG 


AAAAGGAGCG 


GTTCCTCAAG 


GTCGTTGGGC 


TTCTGGTGAG 


CCACCAGATA 


240 


ACGTTTGAGA AAGCTGCCGA 


GCTTCTGGAC 


ATGAGGCTCG 


AAGAGCTGGC 


GTTCCTCCTT 


300 


GACAAGCTCG 


GCGTTGAGTA 


CTCGCTTCTT 


GATGATGAAG 


AGGCCAGACT 


TGAGAGAGAA 


360 


GAGGCCAATA AGCTCATGGG 


GGAAATGAAG 


GGTGGAGCGT 


TTGTCTGATT 


CTTCTGAGCT 


420 


GTTATTGGTG 


TTTCACAGGC 


TGGGAGGTGG 


TGGATT ATG 
Met 


ATC CTC GAT ACA GAC 
He Leu Asp Thr Asp 


474 



1 5 

TAC ATC ACC GAA GAC GGA AGG CCC GTC ATC AGG GTG TTC AAG AAG GAG 
Tyr He Thr Glu Asp Gly Arg Pro Val He Arg Val Phe Lys Lys Glu 
10 15 " 2 o 
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AAC . GGC, GAG. TTC. AAA ' ATE- GAG' TAG GAC' AGG 1 GAC 'TTC'' GAG' CCT" TAC ATC 

Asn Gly Glu Phe Lys lie Glu Tyr Asp Arg Asp Phe Glu Pro Tyr lie 
25 3 o ■ 35 

TAC GCT CTC CTG AAG GAC GAT TCC GCG ATC GAG GAC GTC AAG AAG ATA 

Tyr Ala Leu Leu Lys Asp Asp Ser Ala lie Glu Asp Val Lys Lys He 
40 45 50 

ACT GCA AGC CGG CAC GGT ACC ACC GTC AGG GTC GTC AGG GCC GGG AAG 

Thr Ala Ser Arg His Gly Thr. Thr Val Arg Val Val Arg Ala Gly Lys 
55 60 65 ' 7Q 

GTG' AAG AAG AAG TTC CTC GGC AGG CCG ATA GAG GTC TGG AAG CTC TAC 

Val Lys Lys Lys Phe Leu Gly Arg Pro He Glu Val Trp Lys Leu Tyr 

75 80 85 

TTC ACC CAT CCC CAG GAC GTT CCG GCA ATC AGG GAC AAA ATC AGG GAG 

Phe Thr His Pro Gin Asp Val Pro Ala lie Arg Asp Lys lie Arg Glu 
90 95 100 

CAC CCT GCC GTG GTC GAC ATA TAT GAG TAC GAC ATA CCC TTT GCC AAG 

His Pro Ala Val Val Asp lie Tyr Glu Tyr Asp lie Pro Phe Ala Lys 
105 no 115 

CGC TAC CTC ATC GAT AAG GGC CTC ATC CCG ATG GAG GGC GAC GAG GAG 

Arg Tyr Leu He Asp Lys Gly Leu He Pro Met Glu Gly Asp Glu Glu 
120 125 130 

CTC AAG ATG CTC GCC TTC GAC ATC GAG ACG CTC TAC CAC GAG GGC GAG 

Leu Lys Met Leu Ala Phe Asp He Glu Thr Leu Tyr His Glu Gly Glu 
135 140 145 15Q 

GAG TTC GCC GAG GGG CCT ATT CTT ATG ATA AGC TAT GCC GAC GAG GAA 954 

Glu Phe Ala Glu Gly Pro He Leu Met He Ser Tyr Ala Asp Glu Glu 

i55 160 165 

GGG GCG AGG GTA ATA ACC TGG AAG AAG ATC GAC CTT CCC TAC GTT GAC 

Gly Ala Arg Val He Thr Trp Lys Lys He Asp Leu Pro Tyr Val Asd 
170 175 ' iso 

GTC GTT TCA ACG GAG AAG GAG ATG ATA AAG CGC TTC CTG AAG GTT GTC 1050 

Val Val Ser Thr Glu Lys Glu Met He Lys Arg Phe Leu Lys Val Val 
185 190 195 

AAG GAG AAG GAC CCC GAT GTC CTC ATA ACC TAC AAC GGC GAC AAC TTC 

Lys Glu Lys Asp Pro Asp Val Leu He Thr Tyr Asn Gly Asp Asn Phe 
200 205 210 

GAC TTC GCT TAC CTC AAG AAG CGC TCC GAG AAG CTC GGC GTT AAG TTC 

Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu Lys Leu Gly Val Lys Phe 
215 220 225 230 

ATC CTC GGA AGG GAC GGC AGC GAG CCG AAG ATA CAG AGG ATG GGC GAC 1194 

He Leu Gly Arg Asp Gly Ser Glu Pro Lys He Gin Arg Met Gly Asp 

235 240 ~ 245 

CGC TTC GCC GTC GAG GTG AAG GGA AGA ATA CAC TTC GAC CTC TAC CCC 1242 

Arg Phe Ala Val Glu Val Lys Gly Arg He His Phe Asp Leu Tyr Pro 
250 255 260 



570 



618 



666 



714 



762 



810 



858 



906 



1002 



1098 



1146 
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1386 



1434 



1482 



1530 



GTC. ATA- AGA-GA^ACG- ATC- AAC-CTG- CCC' V ACCTAC"'ACG "CTG' GAGGCC GTC 1290 
Val He Arg His Thr lie Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val 
265 270 275 

TAG GAG GCG ATT TTT GGG GAG CCA AAG GAG AAG GTC TAC GCT GAG GAG 133 8 
Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu Lys Val Tyr Ala Glu Glu 
280 285 290 

ATA GCG CAG GCC TGG GAA ACG GGC GAG GGG CTT GAG CGC GTC GCG CGC 
lie Ala Gin Ala Trp Glu Tor Gly Glu Gly Leu Glu Arg Val Ala Arg 

300 305 310 

TAC TCG ATG GAG GAC GCC AAG GTA ACC TAC GAG CTG GGA AGG GAG TTC 
Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr Glu Leu Gly Arg Glu Phe 
315 320 " 325 

TTC CCG ATG GAG GCC CAA CTT TCT CGG CTG GTC GGT CAG AGC TTC TGG 
Phe Pro Met Glu Ala Gin Leu Ser Arg Leu Val Gly Gin Ser Phe Tro 
330 335 340 

GAC GTC TCG CGC TCC AGC ACC GGC AAC CTC GTC GAG TGG TAC CTC CTC 
Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Tyr Leu Leu 
345 350 355 

AGG AAG GCC TAC GAG AGG AAC GAG CTG GCA CCG AAC AAG CCC TCC GGC 1578 
Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Ser Gly 
360 365 370 

AGA GAA CTT GAG AGG CGC CGC GGG GGC TAC GCC GGC GGC TAC GTC AAG 
Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr Ala Gly Gly Tyr Val Lvs 
375 400 405 410 

GAG CCG GAG AGG GGA CTT TGG GAG AAC ATA GCT TAT TTA GAT TTT AGG 
Glu Pro Glu Arg Gly Leu Trp Glu Asn He Ala Tyr Leu Asp Phe Arg 
415 420 425 

2ST. CAT CCT GCC GAC ACT AAA GTC ATT GTC AAA GGG AAG GGC GTT GTA 1722 
Cys His Pro Ala Asp Thr Lys Val lie Val Lys Gly Lys Gly Val Val 
430 435 440 

AAC ATC AGC GAA GTT AGG GAG GGG GAC TAC GTT CTC GGC ATA GAC GGC 
Asn lie Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
445 450 455 

TGG CAG AAG GTT CAA AGG GTC TGG GAG TAT GAT TAC GAG GGA GAA CTC 1818 
Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
460 465 470 

GTA AAT ATA AAC GGC CTT AAG TGC ACA CCG AAC CAT AAG CTT CCG GTC 
Val Asn He Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
475 480 485 490 

GTT AGG AGG ACT GAG AGG CAG ACT GCG ATA AGG GAC AGC CTT GCA AAG 1914 
Val Arg Arg Thr Glu Arg Gin Thr Ala lie Arg Asp Ser Leu Ala Lys 
495 500 505 

TCT TTT CTC ACG AAA AAA GTT AAA GGT AAG CTG ATA ACC ACG CCT CTC 1962 
Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu He Thr Thr Pro Leu 
510 515 520 



1626 



1674 



1770 



1866 
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665 



2010 



2058 



2106 



2154 



TTT GAA-AAA-ATC GGG AAG" ATC GAG CGA GAG GAC GTG CCA GAA GAG GAG 
Phe Glu Lys lie Gly Lys lie Glu Arg Glu Asp Val Pro Glu Glu Glu 
525 530 535 

ATA CTC AAA GGA GAA CTC GCC GGA ATA ATC CTG GCT GAG GGC ACA CTC 
lie Leu Lys Gly Glu Leu Ala Gly lie lie Leu Ala Glu Gly Thr Leu 

CTG AGA AAG GAT GTC GAG TAC TTT GAC TCT TCC AGA GGG AAG AAG AGA 
Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
555 560 565 5 7o 

GTA TCA CAC CAG TAC AGG GTT GAA ATA ACC GTT GGG GCG CAG GAG GAG 
Val Ser His Gin Tyr Arg Val Glu lie Thr Val Gly Ala Gin Glu Glu 
575 580 585 

GAC TTC CAG AGG AGG ATC GTT TAC ATT TTC GAA CGC CTC TTT GGG GTA 2202 
Asp Phe X Arg Arg He Val Tyr lie Phe Glu Arg Leu Phe Gly Val 
590 595 6 oo 

ACT CCC AGT GTT TAC CGG AAA AAG AAC ACA AAC GCA ATA ACG TTC AAA 
Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala lie Thr Phe Lys 
605 610 ' 615 

GTT GCC AAA AAA GAG GTT TAT CTT AGG GTT AGG GAA ATT ATG GAT GGC 
Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu lie Met Asp Gly 
620 625 630 

ATT GAG AAC CTC CAC GCT CCT TCT GTG TTA AGG GGC TTT TTT GAA GGA 2346 
lie Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly ~ 
635 640 645 eso 

GAC GGA AGC GTC AAC AAG GTC CGG AAG ACA GTG GTA GTG AAT CAG GGC 
Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
655 660 



2250 



2298 



2394 



2442 



ACC AAT AAT GAA TGG AAA ATT GAA GTG GTG TCA AAA CTC CTC AAC AAG 
Thr Asn Asn Glu Trp Lys lie Glu Val Val Ser Lys Leu Leu Asn Lys 
670 675 680 

TTG GGG ATT CCG CAT AGA AGG TAC ACA TAC GAT TAC ACC GAA AGA GAA 2490 
Leu Gly lie Pro His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
685 690 695 

AAA ACC ATG ACA ACG CAT ATA CTT GAG ATA GCC GGC AGG GAT GGG TTA 
Lys Thr Met Thr Thr His lie Leu Glu lie Ala Gly Arg Asp Gly Leu 
700 70S 7 10 

tT° f ^ ^ ^ G ACC ATT GTG GGA TO ATA ACT GAG AAG AAC ATG 

lie Leu Phe Gin Thr lie Val Gly Phe lie Ser Thr Glu Lys Asn Met 

715 720 725 730 

GCG CTG GAG GAG GCA ATC AGG AAC AGG GAA GTG AAC CGC CTA GAA AAC 
Ala Leu Glu Glu Ala lie Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
7 35 740 " 745 

AAT GCC TTC TAT ACC CTA GCC GAC TTT ACG GCG AAG ACA GAG TAC TAC 
Asn Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tyr Tyr 
750 755 780 



2538 



2586 



2634 



2682 
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2826 



2874 



2922 



AAG- GGC - AAA-'GTT 'TAG GAG' 'TTA ■ ACC CTT "GAG " GGA 'ACG CCC TAT TAC TTC 2730 
Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
7 85 790 795 

GCC AAT GGC ATA CTG ACC CAC AAT X£fi CTA TAT CCT TCG ATT ATA ATT 2778 
Ala Asn Gly He Leu Thr His Asn Ser Leu Tyr Pro Ser He lie lie 
8°0 805 810 

TCC CAC AAC GTC TCC CCC GAT ACG CTC AAC CGC GAG GGC TGC GGG GAG 
Ser His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu 
815 820 825 8 3o 

TAC GAC GAG GCT CCG CAG GTA GGG CAT CGC TTT TGT AAG GAC TTC CCC 
Tyr Asp Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro 
835 840 845 

GGC TTC ATC CCC AGC CTC CTC GGT GAC CTG CTC GAC GAG AGG CAG AAG 
Gly Phe He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lys 
855 860 ' 865 

GTA AAG AAG CAC ATG AAG GCC ACG GTG GAC CCG ATA GAG AAG AAG CTC 2970 
Val Lys Lys His Met Lys Ala Thr Val Asp Pro He Glu Lys Lys Leu 
870 875 880 

CTC GAT TAC AGG CAG CGC GCA ATT AAA ATC CTC GCC AAC AGC TTC TAC 3018 
Leu Asp Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser Phe Tyr 
885 890 895 

GGC TAC TAT GGC TAC GCA AAG GCC CGC TGG TAC TGC AAG GAG TGC GCC 
Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala 
900 90S 910 915 

GAG AGC GTT ACC GCC TGG GGC AGG CAG TAC ATT GAG ACC ACC ATG AGG 3114 
Glu Ser Val Thr Ala Trp Gly Arg Gin Tyr He Glu Thr Thr Met Arq 
920 925 930 

GAA ATA GAG GAA AAA TTT GGC TTT AAA GTG CTG TAC GCG GAT AST GTT 3162 
Glu He Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Ser Val 
535 940 945 

ACA GGG GAC ACA GAG GTA ACC ATC AGA AGA AAC GGC AGG ATT GAG TTC 3210 
Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He Glu Phe 
950 955 960 

GTT CCA ATC GAG AAA CTC TTT GAG CGC GTT GAT CAC CGT GTT GGT GAG 3258 
Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val Gly Glu 
965 970 975 

AAG GAG TAC TGC GTT CTT GGA GGG GTT GAG GCA CTG ACA CTC GAC AAC 
Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu Asp Asn 
980 985 990 995 

AGG GGC AGG CTC GTG TGG AAG AAG GTT CCG TAC GTC ATG AGA CAT AAA 
Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Arg His Lvs 
1000 1005 ioio 

ACG GAC AAA AGA ATC TAT AGG GTA TGG TTC ACC AAC TCT TGG TAC CTT 
Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp Tyr Leu 
1015 1020 1025 



3066 



3306 



3354 



3402 
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3450 



3498 



3546 



3642 



3738 



GAG GTC- AGG-.GAG- GAT-CAC-TCG" CTA ATA' GGC' TAC CTC AAC ACA AGC AAA 
Asp Val Thr Glu Asp His Ser Leu lie Gly Tyr Leu Asn Thr Ser Lys 
1030 1035 1040 

GTC AAA CCC GGA AAG CCC TTG AAA GAG CGT CTC GTC GAG GTC AAG CCA 
Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val Lys Pro 
1045 . 1050 1055 

GAA GAA TTG GGG GGT AAG GTC AAG TCT CTC ATT ACG CCC AAT CGG CCA 
Glu Glu Leu Gly Gly Lys Val Lys Ser Leu lie Thr Pro Asn Arg Pro 
1060 1065 1070 1075 

ATT GCC CGT ACC ATC AAG GCC AAC CCC ATT GCC GTC AAG CTC TGG GAG 3594 
He Ala Arg Thr He Lys Ala Asn Pro lie Ala Val Lys Leu Trp Glu 
1080 1085 1090 

TTA ATT GGC CTG CTG GTG GGA GAT GGC AAC TGG GGT GGA CAA TCG AAC 
Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin Ser Asn 
1095 iioo " 1105 

TGG GCC AAA TAC TAC GTT GGC CTC TCC TGT GGG CTG GAT AAA GCC GAA 3 690 
Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys Ala Glu 
HIO 1H5 U20 

ATA GAG AGA AAA GTC CTG AAC CCT TTA AGA GAG GCA AGC GTC ATC TCC 
He Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val He Ser 
H25 H30 1135 

AAC TAC TAC GAC AAG AGC AAG AAG GGC GAC GTT TCC ATA CTC TCC AAG 
Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser He Leu Ser Lys 
1140 H45 H50 ii 55 

TGG CTC GCC GGA TTC ATG GTC AAA TAC TTC AAA GAT GAA AAT GGG AAC 
Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn Gly Asn 
H60 U65 U70 

AAG GCC ATT CCC AGC TTC ATG TTC AAC CTT CCA AGG GAA TAC ATA GAG 
Lys Ala He Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr He Glu 
1175 H80 1185 

GCC TTT CTA CGG GGG CTG TTT TCA GCG GAC GGA ACG GTA AGC TTG CGT 
Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser Leu Aro 
H90 H9S 1200 

AGA GGA ATC CCA GAA ATT AGA CTG ACA AGC GTT AAC AGA GAG CTT AGT 3978 
Arg Gly He Pro Glu He Arg Leu Thr Ser Val Asn Arg Glu Leu Ser 
1205 1210 1215 

GAT GCC GTG AGA AAG TTG CTG TGG CTG GTT GGG GTC TCC AAC TCA CTA 

™ Ala Val Ar9 LyS LSU Leu Trp Leu Val G1 y Vai Ser Asn Ser Leu 
1220 1225 1230 1235 

TTC ACC GAA ACC AAG CCA AAC CGG TAC CTG GAG AAA GAA AGT GGA ACG 4074 
Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser Gly Thr 
124 0 1245 1250 

CAT TCG ATT CAC GTG AGG ATA AAG AAC AAG CAT CGC TTT GCC GAT AGA 4122 
His Ser He His Val Arg He Lys Asn Lys His Arg Phe Ala Asp Arg 
1255 1260 i 265 



3786 



3834 



3882 



3930 



4026 
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4266 



4314 



4362 



4410 



4458 



ATA- GGC TTT" CTC : ' ATA*'GAC AGA" AAA TCC ' ACC "AAA' CTC TCC GAG AAC CTG 4170 
lie Gly Phe Leu lie Asp Arg Lys Ser Thr Lys Leu Ser Glu Asn Leu 
1270 1275 128 0 

GGG GGA CAT ACA AAC AAG AAG AGG GCT TAC AAA TAT GAT TTT GAC TTG 4218 

Gly ?^c HiS Thr ASn LyS LyS Arg Ala ^ r A SP Phe Asp Leu 

1285 1290 1295 

GTA TAC CCC AGA AAA ATC GAA GAG ATA ACC TAC GAC GGC TAC GTC TAT 
Val Tyr Pro Arg Lys lie Glu Glu lie Thr Tyr Asp Gly Tyr Val Tvr 
1300 1305 1310 y Jig 

GAC ATC GAG GTT GAG GGA ACC CAC AGG TTC TTC GCC AAC GGA ATA CTC 
Asp lie Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly lie Leu 
1320 1325 i33b 

GTT CAC AAC A£A GAC GGC TTT TTC GCA ACA ATC CCC GGA GCG GAC GCC 
Val His Asn Thr Asp Gly Phe Phe Ala Thr He Pro Gly Ala Asp Ala 
1335 1340 1345 

GAG ACG GTC AAA AAG AAG GCC AGG GAG TTC CTT AAC TAC ATT AAC CCC 
Glu Thr Val Lys Lys Lys Ala Arg Glu Phe Leu Asn Tyr He Asn Pro 
1350 1355 i3 6 o 

AAG CTG CCC GGT CTC CTC GAA CTC GAG TAC GAG GGC TTC TAC AGG CGC 
Lys Leu Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Arg Arg 
1365 1370 1375 

GGT TTC TTC GTA ACC AAG AAG AAG TAC GCG GTG ATA GAC GAG GAG GGC 4506 
Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Val He Asp Glu Glu Gly 
1380 1385 1390 13 g 5 

AAG ATA ACG ACG CGC GGG CTT GAG ATC GTC CGG CGC GAC TGG AGT GAG 4554 
Lys He Thr Thr Arg Gly Leu Glu lie Val Arg Arg Asp Trp Ser Glu 
1400 140S i4i 0 

GTG GCT AAG GAG ACG CAG GCG AGG GTC TTG GAG GCC ATA CTG CGG CAC 
Val Ala Lys Glu Thr Gin Ala Arg Val Leu Glu Ala He Leu Arg His 
1415 1420 . 14 2 5 

GGT GAC GTC GAG GAG GCC GTG AGG ATT GTC AAG GAA GTG ACG GAA AAG 
Gly Asp Val Glu Glu Ala Val Arg He Val Lys Glu Val Thr Glu Lys 
1430 1435 1440 

CTG AGC AAG TAC GAG GTT CCG CCA GAG AAG CTC GTC ATC CAC GAG CAG 
Leu Ser Lys Tyr Glu Val Pro Pro Glu Lys Leu Val He His Glu Gin 
1445 1450 1455 

ATT ACC AGG GAG CTG AAG GAC TAC AAG GCC ACC GGC CCG CAC GTG GCC 4746 
He Thr Arg Glu Leu Lys Asp Tyr Lys Ala Thr Gly Pro His Val Ala 
1460 1465 1470 1475 

ATA GCG AAG CGC CTC GCC GCG AGG GGG ATT AAG GTT CGC CCT GGG ACA 
He Ala Lys Arg Leu Ala Ala Arg Gly He Lys Val Arg Pro Gly Thr 
1480 1485 149Q 



4602 



4650 



4698 



4794 



GTC ATC AGC TAC ATC GTC CTG AAA GGT TCC GGC AGG ATA GGG GAC AGG 4842 
Val He Ser Tyr He Val Leu Lys Gly Ser Gly Arg He Gly Asp Arg 
1495 1500 1505 
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JET??* f C T^'f C ' ^ G TTC'GAC CCC ACQ AAG CAC AGG TAC GAT GCG 4890 

Thr lie Pro Phe Asp Glu Phe Asp Pro Thr Lys His Arg Tyr Asp Ala 
1510 1515 1520 

GAG TAC TAC ATC GAG AAC CAG GTT CTG CCG GCG GTG GAG AGA ATC CTC 4938 

Glu Tyr Tyr lie Glu Asn Gin Val Leu Pro Ala Val Glu Arg lie Leu 

1525 1530 1535 

AAG GCC TTC GGC TAC AAG AAG GAG GAT TTG CGC TAC CAG AAG ACG CGG 4986 

Lys Ala Phe Gly Tyr Lys Lys Glu Asp Leu Arg Tyr Gin Lys Thr Arg 
1540 1545 1550 " 1555 

CAG GTT GGG CTG GGG GCG TGG CTC AAA ATG GGG AAG AAA TGA 502 8 

Gin Val Gly Leu Gly Ala Trp Leu Lys Met Gly Lys Lys 
1560 15G5 1568 

AGGCCAAGCT T 



5039 



(2) INFORMATION POUR LA SEQ ID NO: 2 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE • 
(A) LONGUEUR: 774 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: ADN polymerase de THERMOCOCCUS 
fumicolans Tfu 
(xi) DESCRIPTION DE LA SEQUENCES : SEQ ID NO: 2 : 

Met He Leu Asp Thr Asp Tyr He Thr Glu Asp Gly Arg Pro Val He 
1 5 io 15 

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys lie Glu Tyr Asp Arg 
20 25 30 

Asp Phe Glu Pro Tyr lie Tyr Ala Leu Leu Lys Asp Asp Ser Ala lie 
35 40 45 

Glu Asp Val Lys Lys He Thr Ala Ser Arg His Gly Thr Thr Val Arg 
b0 55 60 

Val Val Arg Ala Gly Lys Val Lys Lys Lys Phe Leu Gly Arg Pro He 
65 70 ■ 75 go 

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gin Asp Val Pro Ala He 
85 go 95 

Arg Asp Lys He Arg Glu His Pro Ala Val Val Asp He Tyr Glu Tvr 
100 105 no 

Asp He Pro Phe Ala Lys Arg Tyr Leu He Asp Lys Gly Leu He Pro 
115 120 125 

Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp He Glu Thr 
130 135 14Q 

Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro lie Leu Met He 
145 150 155 iso 

Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val He Thr Trp Lys Lys He 
165 170 175 
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Asp- Leu Pro' Tyr - Val' Asp VaT Var 'Ser Thr Glu Lys Glu Met lie Lys 
180 iss 19Q 

Arg Phe Leu Lys Val Val Lys Glu Lys Asp Pro Asp Val Leu lie Thr 
195 200 205 " 

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu 
210 215 2 20 

Lys Leu Gly Val Lys Phe lie Leu Gly Arg Asp Gly Ser Glu Pro Lvs 
225 2 30 235 240 

lie Gin Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg He 
2 45 250 * 255 

His Phe Asp Leu Tyr Pro Val lie Arg His Thr He Asn Leu Pro Thr 
260 265 270 

Tyr Thr Leu Glu Ala Val Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu 
275 280 285 

Lys Val Tyr Ala Glu Glu He Ala Gin Ala Trp Glu Thr Gly Glu Gly 
290 295 300 

Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tvr 
305 310 315 3 lo 

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gin Leu Ser Arg Leu 
325 330 335 

Val Gly Gin Ser Phe Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
340 345 350 

Val Glu Trp Tyr Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
355 360 365 

Pro Asn Lys Pro Ser Gly Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr 
370 375 380 

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn He 
385 390 395 400 

Ala Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser He He He Ser His 
4 °5 405 410 

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu Tyr Asn 
415 420 425 



Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 

430 435 440 

He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lys Val Lvs 

445 450 455 

Lys His Met Lys Ala Thr Val Asp Pro He Glu Lys Lys Leu Leu Asp 

460 A cc ^ 



465 



470 



475 



Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser Phe Tyr Gly Tyr 
480 485 490 
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Tyr- Gly Tyr ATa Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 
495 500 505 

Val Thr Ala Trp Gly Arg Gin Tyr lie Glu Thr Thr Met Arg Glu lie 
510 515 520 

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe 
525 530 535 

Phe Ala Thr He Pro Gly Ala. Asp Ala Glu Thr Val Lys Lys Lys Ala 
540 545 555 5 6 o 

Arg Glu Phe Leu Asn Tyr He Asn Pro Lys Leu Pro Gly Leu Leu Glu 
565 570 575 

Leu Glu Tyr Glu Gly Phe Tyr Arg Arg Gly Phe Phe Val Thr Lys Lvs 
580 585 590 

Lys Tyr Ala Val lie Asp Glu Glu Gly Lys He Thr Thr Arg Gly Leu 
595 • 600 605 

Glu He Val Arg Arg Asp Trp Ser Glu Val Ala Lys Glu Thr Gin Ala 
610 61S 620 

Arg Val Leu Glu Ala He Leu Arg His Gly Asp Val Glu Glu Ala Val 
625 630 635 640 

Arg He Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
645 650 655 

Pro Glu Lys Leu Val He His Glu Gin He Thr Arg Glu Leu Lys Aso 
660 665 " 670 

Tyr Lys Ala Thr Gly Pro His Val Ala He Ala Lys Arg Leu Ala Ala 
675 680 685 

Arg Gly He Lys Val Arg Pro Gly Thr Val He Ser Tyr He Val Leu 
690 695 700 

Lys Gly Ser Gly Arg He Gly Asp Arg Thr He Pro Phe Asp Glu Phe 
705 710 715 720 

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr He Glu Asn Gin 
725 730 735 

Val Leu Pro Ala Val Glu Arg He Leu Lys Ala Phe Gly Tyr Lys Lys 
740 745 75Q 

Glu Asp Leu Arg Tyr Gin Lys Thr Arg Gin Val Gly Leu Gly Ala Trp 
755 760 765 

Leu Lys Met Gly Lys Lys 
770 774 
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(2) INFORMATION POUR LA SEQ ID NO: 3 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 360 acides amines 
(n) TYPE DE MOLECULE: proteine 
(ix) CARACTERI STIQUES 

(A) NOM/CLE: inteine I-Tfu-1 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 3 : 

Cys His Pro Ala Asp Thr Lys Val He Val Lys Gly Lys Gly Val Val 
1 5 10 ' 15 

Asn lie Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
20 25 30 

Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
35 40 45 

Val Asn lie Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
50 55 60 

Val Arg Arg Thr Glu Arg Gin Thr Ala lie Arg Asp Ser Leu Ala Lys 
65 70 75 so 

Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu He Thr Thr Pro Leu 
85 go 95 

Phe Glu Lys He Gly Lys He Glu Arg Glu Asp Val Pro Glu Glu Glu 
100 105 110 

He Leu Lys Gly Glu Leu Ala Gly He He Leu Ala Glu Gly Thr Leu 
115 120 i2 5 

Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
130 135 140 

Val Ser His Gin Tyr Arg Val Glu He Thr Val Gly Ala Gin Glu Glu 
145 150 155 160 

Asp Phe X Arg Arg He Val Tyr He Phe Glu Arg Leu Phe Gly Val 
165 170 175 

Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala He Thr Phe Lys 
180 185 190 

Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu He Met Asp Gly 
195 200 205 

He Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 
210 215 220 

Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
225 "0 235 240 

Thr Asn Asn Glu Trp Lys He Glu Val Val Ser Lys Leu Leu Asn Lys 
245 250 255 

Leu Gly He Pro His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
260 265 270 
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Lys Thr Met Thr Thr His He Leu Glu lie Ala Gly Arg Asp Gly Leu 
275 280 285 

lie Leu Phe Gin Thr lie Val Gly Phe lie Ser Thr Glu Lys Asn Met 
29° 295 300 

Ala Leu Glu Glu Ala He Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
305 3 10 315 320 

Asn Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tvr Tvr 
325 330 335 

Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
340 345 350 

Ala Asn Gly He Leu Thr His Asn 
355 360 

(2) INFORMATION POUR LA SEQ ID NO: 4 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 389 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: inteine I-Tfu-2 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 4 : 

Ser Val Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He 
1 5 10 15 

Glu Phe Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val 
20 25 30 

Gly Glu Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu 
35 40 45 

Asp Asn Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Arg 
50 55 60 

His Lys Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp 
65 ™ 7S 80 

Tyr Leu Asp Val Thr Glu Asp His Ser Leu He Gly Tyr Leu Asn Thr 
85 90 95 

Ser Lys Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val 
100 105 ~ no 

Lys Pro Glu Glu Leu Gly Gly Lys Val Lys Ser Leu He Thr Pro Asn 
115 120 125 

Arg Pro He Ala Arg Thr He Lys Ala Asn Pro He Ala Val Lys Leu 
130 135 140 

Trp Glu Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin 
i45 150 155 " 160 

Ser Asn Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys 
165 170 175 
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Ala Glu He Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val 

180 185 190 

lie Ser Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser lie Leu 

195 200 205 

Ser Lys Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn 

210 215 220 

Gly Asn Lys Ala lie Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr 



230 



235 



240 



lie Glu Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser 
245 250 255 

Leu Arg Arg Gly lie Pro Glu lie Arg Leu Thr Ser Val Asn Arg Glu 
260 265 270 

Leu Ser Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn 
275 280 28S 

Ser Leu Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser 

Gly Thr His Ser lie His Val Arg lie Lys Asn Lys His Arg Phe Ala 



310 



315 



320 



Asp Arg He Gly Phe Leu lie Asp Arg Lys Ser Thr Lys Leu Ser Glu 
325 330 " 335 

Asn Leu Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe 
340 345 3 5 o 

Asp Leu Val Tyr Pro Arg Lys lie Glu Glu lie Thr Tyr Asp Gly Tyr 



360 



365 



Val Tyr Asp He Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly 
370 375 3 80 

He Leu Val His Asn 
385 389 
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REVENDICATIONS 



1) ADN polymerase purifiee thermostable 
d'archabacteries de 1 1 espece Thermococcus fumicolans 
ayant un poids moleculaire de l'ordre de 89 000 daltons 
et ses derives enzymatiquement equivalents. 

2) ADN polymerase selon la revendication 1 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ ID NO:l ou 
un fragment de celle-ci ou encore un assemblage de tels 
fragments . 



3) ADN polymerase selon la revendication 2 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ ID N0:2. 

4) Une sequence d'ADN constitute par ou 
comprenant la sequence codant pour une ADN polymerase 
selon quelconque des revendications 1 a 3 . 



5) Une sequence d'ADN selon la revendication 4 
constitute par ou comprenant la sequence comprise entre 
les nucleotides 357 a 5028 de la sequence SED ID NO: 1, 
ou un fragment de celle-ci ou encore un assemblage de 
tels fragments. 



6) Une sequence d'ADN selon 1 • une des 
revendications 4 a 5 constitute par ou comprenant les 
nucleotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
la sequence d'ADN representee dans la liste de sequences 
en annexe sous le numero SED ID NO: 1. 



35 



7) Un vecteur contenant la sequence d'ADN de 
l'une quelconque des revendications 4 a 6. 
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8) Un hote transforme par un vecteur selon la . 
revendication 7 . 

9) Procede de preparation d'une ADN polymerase 
5 thermostable d' archaebacteries de 1 ' espece Thermococcus 

fumicolans, caracterise en ce que 1 1 on cultive l'h6te 
selon la revendication 8 dans des conditions permettant 
1' expression de ladite ADN polymerase et en ce que 1 ' on 
extrait et recupere celle-ci par tout moyen approprie. 

10 

10) Procede d' amplification enzymatique d'une 
sequence d'acide nucleique caracteris6 en ce que l'on met 
en oeuvre une ADN polymerase thermostable selon l'une 
quelconque des revendications 1 a 3 . 

15 

11) Int6ine purifiee thermostable 
d 1 archaebacteries de 1' espece Thermococcus fumicolans. 

20 
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EB S Pab 46 50 51 52 PM 59 60 



PM 

212 kDa-* 
170 




v.'Xva' XAWS. vX'Xv . • \; -' r ,y 



.... .<. A 




Pab 53 54 55 56 57 58 M 



212 kDa-*- 
170 * 




EB = extrait brut de sonication 

S = surnageant chauffe 

Pab = SOU de Pab 

PM = poids moleculaire en kDa 
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Fig .4 



28 29 30 31 32 33 P M kDa 




28, 29, 30, 31, 32, 33: fractions aprfes la deuxieme Bleue 

P: phosphorylase B (92 kDa) 

M: marqueur de poids mol&ulaire 
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Fig. 5 



P 46 47 48 49 M kDa 




P: phosphorylase B (92 kDa) 

46, 47, 48, 49: fractions apres phosphocellulose 

M: marqueur de poids moleculaire 
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Fig. 6 



p 2 3 4 5 6 7 M KDa 



92KDa 




P: phosphorylase B (92 kDa) 

2, 3, 4, 5, 6, 7: fractions d'exclusions sur MonoQ 

M: marqueur de poids moleculaire 
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Fig. 7 



fractions d'exclusion de la MonoQ 



vent Taqpol Raoul kb 



2,8 
2,3 

1,8 
1,41 
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